Covid-19疾病迅速蔓延,在中国确认第一个积极案件后近三个月,冠状病毒开始遍布美国。一些州和县报告了大量的积极病例和死亡,而一些据报道的Covid-19相关病例和死亡率。本文在县级分析了可能影响Covid-19感染和死亡率风险的因素。使用K-Means聚类和多种分类模型的创新方法来确定最关键的因素。结果表明,平均温度,低于贫困人数,肥胖,空气压力,人口密度,风力速度,经度和未知人民百分比的成年人的百分比是最重要的属性
translated by 谷歌翻译
Event Extraction (EE) is one of the fundamental tasks in Information Extraction (IE) that aims to recognize event mentions and their arguments (i.e., participants) from text. Due to its importance, extensive methods and resources have been developed for Event Extraction. However, one limitation of current research for EE involves the under-exploration for non-English languages in which the lack of high-quality multilingual EE datasets for model training and evaluation has been the main hindrance. To address this limitation, we propose a novel Multilingual Event Extraction dataset (MEE) that provides annotation for more than 50K event mentions in 8 typologically different languages. MEE comprehensively annotates data for entity mentions, event triggers and event arguments. We conduct extensive experiments on the proposed dataset to reveal challenges and opportunities for multilingual EE.
translated by 谷歌翻译
在本文中,我们提出了一个样本复杂性,以从嘈杂的样本中学习单纯形。给出了$ n $的数据集,其中包括i.i.d.样品从$ \ mathbb {r}^k $中的未知任意单纯形上的均匀分布中得出,其中假定样品被任意幅度的加性高斯噪声损坏。我们提出了一种策略,该策略可以输出一个单纯概率,总变化距离为$ \ epsilon + o \ left(\ mathrm {snr}^{ - 1} \ right)$从true Simplex中,对于任何$ \ Epsilon> 0 $。我们证明,要接近True Simplex,就足以拥有$ n \ ge \ tilde {o} \ left(k^2/\ epsilon^2 \ right)$ samples。在这里,SNR代表信噪比,可以看作是单纯形直径与噪声的标准偏差的比率。我们的证明是基于样品压缩技术的最新进步,这些进步已经显示出在高维高斯混合模型中的密度估计的紧密范围方面的承诺。
translated by 谷歌翻译
在本研究中,飞行射击数,飞行高度,燃料类型和进气温的影响对推力燃油消耗,推力,进气质量流量,热和推进效率的影响,以及发驱动效率和效率研究了F135 PW100发动机中的充电破坏率。根据第一阶段获得的结果,为了对上述发动机周期的热力学性能进行建模,飞行仪数和飞行高度分别被认为分别为2.5和30,000 m。由于在高空飞行条件下超音速飞行的运行优势以及氢气的较高推力。因此,在第二阶段,考虑到上述飞行条件,已经获得了智能模型,以预测使用深度学习方法的输出参数(即推力,推力特定的燃料消耗和整体燃油效率)。在达到的深神经模型中,高压涡轮机,风扇压力比,涡轮机入口温度,进气温度和旁路比的压力比被视为输入参数。提供的数据集随机分为两组:第一组包含6079个用于模型训练的样本,第二组包含1520个用于测试的样本。特别是,ADAM优化算法,均方根误差的成本函数以及整流线性单元的活动函数用于训练网络。结果表明,深神经模型的误差百分比等于5.02%,1.43%和2.92%,以预测推力,推力特定的燃油消耗和整体自我效率,这表明已达到的模型在估计估算中的成功成功本问题的输出参数。
translated by 谷歌翻译
我们介绍了Dreamento(Drea Engineering Toolbox),这是一种使用Zmax(Hypnodyne Corp.,Sofia,Bulgaria,Bulgaria)的开源Python Python套件,用于梦想工程。 DREAMENTO的主要功能是(1)图形用户界面(GUI)(2)(2)中的实时记录,监视,分析和刺激以及所得数据的离线后处理。 Dreamento实时能够(1)记录数据,(2)可视化数据,包括功率光谱分析和导航,(3)自动睡眠评分,(4)感觉刺激(视觉,听觉,触觉), (5)建立文本到语音通信,以及(6)管理自动和手动事件的注释。离线功能有助于其后处理获得的数据,具有重新装修可穿戴数据并将其与不可磨损记录的模式(例如肌电图)相结合的功能。尽管Dreamento的主要应用是用于(清醒)梦想研究的,但它愿意适应其他目的和测量方式。
translated by 谷歌翻译
我们解决了选择性分类的问题,目标是在数据集的所需覆盖范围内实现最佳性能。最新的最新选择性方法通过引入单独的选择头或额外的弃权logit进行体系结构变化。在本文中,我们通过确认最先进的方法的出色性能归功于培训更具概括的分类器,为选择性分类提供了令人惊讶的结果。但是,他们的选择机制是次优的。我们认为,选择机制应植根于目标函数,而不是单独计算的分数。因此,在本文中,我们激发了一种基于分类设置的横向熵损失的替代选择策略,即logits的最大值。我们提出的选择策略在所有覆盖范围和所有数据集中都可以通过大幅度的边距获得更好的结果,而无需任何其他计算。最后,受到我们优越的选择机制的启发,我们建议通过熵最小化进一步正规化目标函数。我们提出的具有修改后损耗功能的最大选择选择可实现选择性分类的新最新结果。
translated by 谷歌翻译
预计机器学习(ML)将在5G边缘计算中发挥重要作用。各种研究已经证明ML非常适合于优化边缘计算系统,因为快速移动性和应用引起的变化发生在边缘。对于ML提供最佳解决方案,重要的是要连续地训练ML模型以包括变化的情景。改变情景(例如,5G基站故障)引起的数据分布的突然变化被称为概念漂移,是持续学习的主要挑战。 ML模型可以在漂移发生的同时呈现高误差率,并且仅在模型学习分布后才会减少错误。在分布式设置中,此问题更加明显,其中多个MAX模型用于不同的异构数据集,最终模型需要捕获所有概念漂移。在本文中,我们表明,在联合学习中使用注意(FL)是处理概念漂移的有效方式。我们使用5G网络流量数据集来模拟概念漂移并测试各种场景。结果表明,注意力可以显着提高FL的概念漂移处理能力。
translated by 谷歌翻译
近来增加大型机器学习模型的趋势需要分发培训和推理任务。考虑到培训这些模型的巨大成本,必须在计算和沟通中解锁优化以获得最佳性能。然而,深入学习框架中的计算和通信内核之间的当前逻辑分离遍及此类障碍的优化机会。通过整体考虑破坏此抽象可以提供许多优化,以提供分布式工作负载中的性能改进。手动应用这些优化需要在每个场景中的底层计算和通信库中的修改,这是耗时和容易出错的。因此,我们呈现Coconet,用DSL表达具有计算和通信的程序。 Coconet包含几种机器学习感知转换,以优化程序和编译器以生成高性能内核。作为第一类构造的计算和通信允许用户在高级抽象上工作,并应用强大的优化,例如融合或传播和计算重叠。 Coconet使我们能够以几行代码在大型语言模型中优化数据,模型和管道平行工作负载。实验显示椰子显着优于最先进的分布式机器学习实现。
translated by 谷歌翻译
第一个已知的冠状病毒疾病2019(Covid-19)于2019年12月确定。它在全球范围内传播,导致许多国家的持续流行,强加的限制和成本。在此期间预测新案例和死亡人数可能是预测未来所需成本和设施的有用步骤。本研究的目的是预测未来100天内的新案例和死亡率,三天和七天。预测每一个天(而不是每天的动机)是调查计算成本降低和仍然实现合理性能的可能性。可以在时间序列的实时预测中遇到这样的场景。六种不同的深入学习方法是对来自世卫组织网站采用的数据进行检查。三种方法是LSTM,卷积LSTM和GRU。然后考虑对每种方法考虑双向延伸,以预测澳大利亚和伊朗国家的新案例和新死亡率。这项研究是新颖的,因为它对上述三个深度学习方法及其双向延伸进行了全面评估,以对Covid-19新案例和新的死亡率时间序列进行预测。据我们所知,这是Bi-Gru和Bi-conv-LSTM模型首次用于Covid-19新案例和新的死亡时间序列的预测。该方法的评估以图形和弗里德曼统计测试的形式提出。结果表明双向模型的误差比其他模型较低。提出了几个错误评估度量来比较所有模型,最后,确定双向方法的优越性。该研究对于针对Covid-19的组织有用,并确定其长期计划。
translated by 谷歌翻译
自我监督的学习表现出了巨大的希望,因为它可以在没有完全采样的数据的情况下训练深度学习MRI重建方法。当前用于物理学指导的重建网络的自我监督的学习方法分裂获得了两个不相交的数据,其中一种用于独立网络中的数据一致性(DC),另一个用于定义培训损失。在这项研究中,我们提出了一种改进的自我监督学习策略,该策略更有效地使用获得的数据来训练物理学指导的重建网络,而无需数据完全采样的数据。提出的通过数据下采样(SSDU)对所提出的多掩码自我监督的学习(SSDU)应用于获得的测量结果,将其分为每个训练样本的多对不相交集,而使用这些对DC单位和DC单位和其中一对,其他用于定义损失的,从而更有效地使用了不足采样的数据。多面罩SSDU应用于完全采样的3D膝盖上,并前瞻性地采样3D脑MRI数据集,用于各种加速度和图案,并与CG-Sense和单膜ssdu dl-MRI以及受监督的DL-MRI以及当时的DL-MRI进行比较。提供了完全采样的数据。膝盖MRI的结果表明,提出的多面罩SSDU胜过SSDU,并与受监督的DL-MRI紧密相关。一项临床读者的研究进一步将多面罩SSDU在SNR和混叠伪影方面高于监督的DL-MRI。大脑MRI的结果表明,与SSDU相比,多面罩SSDU可以达到更好的重建质量。读者的研究表明,与单罩SSDU相比,r = 8时的多面膜SSDU显着改善了重建,r = 8,以及r = 2时的CG-Sense。
translated by 谷歌翻译